## ANTES DE USAR
# Para criar data/movies.csv
dados <- read_csv("/home/marianamendes/agrupamento-filmes/data/natalie.csv")
## Parsed with column specification:
## cols(
##   filme = col_character(),
##   bilheteria = col_double()
## )
import_data("natalie_portman") # ou com o ator/atriz que você escolher
## Loading required package: rvest
## Loading required package: xml2
## 
## Attaching package: 'rvest'
## The following object is masked from 'package:purrr':
## 
##     pluck
## The following object is masked from 'package:readr':
## 
##     guess_encoding
## Warning in rlang::eval_tidy(~as.numeric(gsub("[$|M]", "", BOXOFFICE)),
## <environment>): NAs introduced by coercion
filmes = read_imported_data()

filmes_total <- merge(filmes, dados, by.x="filme", by.y="filme")

Descrição

A atriz escolhida foi Natalie Portman, uma atriz israelense, que nasceu no dia 9 de junho em 1981 (37 anos). Natalie começou a carreira muito cedo, aos 11 anos, quando atuou em The Professional no ano de 1994. Até seus 15 anos já havia participado de 5 filmes.

include_graphics('/home/marianamendes/agrupamento-filmes/data/natalie_1996.jpg')

Até 1996 Natalie fez 5 filmes, todos eles com uma avaliação superior a 50 no RottenTomatoes, contudo com uma bilheteria não tão alta.

filmes_total %>% filter(ano < 1997) %>% ggplot(aes(x=filme, y=avaliacao)) + 
  geom_point(size=5) + 
  geom_segment(aes(x=filme, 
                   xend=filme, 
                   y=0, 
                   yend=avaliacao)) + 
  labs(title="Natalie Portman até 1996", 
       subtitle="Avaliações pelo rotten tomatoes", 
       caption="source: mpg") + 
  theme(axis.text.x = element_text(angle=40, vjust=0.8))

Star Wars e Natalie Portman - 1999!

Em 1999, quando tinha seus 18 anos, iniciou sua participação na saga Star Wars onde interpretou Padmé Amidala. O episódio I, The Phanton Menace, foi um sucesso de bilheteria, arrecadando mais de 800 milhões. Os outros dois episódios também foram bem recebidos pelo público, ambos com mais de 400 milhões nas bilheterias :). A saga foi de extrema importância na carreira da atriz, visto que foram os filmes que mais fizeram sucesso no cinema em toda sua carreira até agora.

p <- filmes_total %>% count(avaliacao, bilheteria.y, ano, filme) %>% plot_ly(
  x = ~ano,
  y = ~bilheteria.y,
  color = ~avaliacao,
  text = ~filme,
  type = "bar"
) 

ggplotly(p)
## Warning: textfont.color doesn't (yet) support data arrays

## Warning: textfont.color doesn't (yet) support data arrays

Estrutura de grupos?

p = filmes %>% 
    ggplot(aes(x = "", y = bilheteria, label = filme)) + 
    geom_jitter(width = .05, alpha = .3, size = 3) + 
    labs(x = "")

ggplotly(p)